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摘要 第 三 方 惩罚 对 合作 的 维系 可 能 来 自 经 济 功能 或 规范 提示 功能 。 先 前 研究 没有 区 分 这 两 种 功能 ， 因 而 未 


能 回答 : 当 惩罚 不 足以 影响 违规 收益 时 ， 是 否 还 能 促进 合作 ? 实验 一 CN = 252) 发 现 即 使 第 三 方 惩罚 无 法 


降低 违规 收益 ， 依 然 能 抑制 自 利 行为 。 实 验 二 ON- 179) 发 现 受 过 惩罚 的 违规 者 在 其 后 的 独裁 者 博弈 表现 


试 的 合作 水 平 显著 高 于 旁观 前 ， 也 高 于 未 旁观 惩罚 的 被 试 。 后 两 个 实验 中 ， 社 会 规范 在 惩罚 与 合作 之 间 均 


起 中 介 作 用 。 这 进一步 证 实 惩罚 对 合作 的 促进 在 很 大 程度 上 是 通过 规范 激活 来 实现 的 ， 并 存在 两 种 溢出 效 


Ni. 惩罚 抑制 了 曾经 的 违规 者 “纵向 溢出 效应 ) 和 旁观 者 横向 溢出 效应 ) 在 新 博弈 情境 下 的 自私 行为 。 


这 两 种 溢出 效应 的 发 现 补充 了 文献 中 占 主导 地 位 的 经 济 学 解释 ， 并 为 理解 人 类 社会 长 时 间 、 大 规模 的 合作 


提供 了 新 视角 。 
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在 社会 科学 中 , 合作 指 的 是 个 体 付 出 成 本 使 他 人 受益 的 行为 (Nowalk, 2006; Rand, 2016), 
非 亲 缘 个 体 间 的 广泛 合作 对 人 类 社会 的 顺利 运行 至 关 重 要 (Fehr & Schurtenberger, 2018), 
为 此 我 们 发 展 出 了 合作 的 社会 规范 (deKwaadsteniet et al., 2007)， 即 被 群体 成 员 所 普遍 接受 
但 不 同 于 法 律 条 规 等 明文 规章 的 有 关 合 作 的 行为 准则 (Cialdini & Trost, 1998 )。 尽 管 合作 规 
范 普遍 存在 于 各 个 文化 中 ， 但 对 合作 规范 的 遵守 并 非 自 然而 然 之 事 (de Kwaadsteniet et al., 
2019)， 而 第 三 方 惩罚 (third-party punishment) 一 一 由 利益 无 关 者 针对 违规 者 所 实施 的 惩罚 
总 体 上 被 认为 是 减少 违规 行为 并 维系 合作 规范 的 重要 力量 之 一 (Balliet et al., 2011; Fehr 
& Gáchter, 2002; Halevy & Halali, 2015)。 在 此 基础 上 ， 学 者 探讨 了 规范 在 惩罚 影响 合作 过 程 
中 的 作用 ,如 Bicchieri 等 (20180 KEL, 惩罚 需要 与 一 定 的 社会 规范 相 结 合 才 能 发 挥 积极 作 


用 ; 类 似 地 , Fehr 和 Williams (2018) 也 注意 到 ,只 有 当 和 群体 成 员 间 存在 相应 的 规范 共识 时 ， 
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第 三 方 惩罚 才能 起 到 促进 合作 的 正面 作用 , 当 规范 共识 缺席 时 , 惩罚 反而 加 速 了 社 群 的 骨 演 ; 
]。 但 另 一 个 更 为 基 
本 的 问题 是 第 三 方 惩罚 为 什么 能 减少 〈 促 进 ) 违规 (合作 ) 行为 ， 而 我 们 注意 到 ， 在 回答 这 
个 问题 上 ， 基 于 规范 视角 的 研究 是 相对 缺席 的 。 目 前 ， 对 上 述 问题 一 种 广 为 接 受 的 解释 主要 
基于 经 济 学 视角 ， 即 第 三 方 惩罚 改变 了 违规 者 的 收益 结构 : 存在 第 三 方 惩罚 的 情况 下 ,个 体 
的 违规 成 本 将 大 幅 上 升 以 至 超过 违规 行为 所 带 来 的 收益 〈 韦 倩 ， 姜 树 广 ,2013; Bicchieri etal., 
2018; Carpenter & Matthews, 2004; Nelissen & Mulder, 2013; Rand etal., 2010), 在 这 种 情况 下 ， 
理性 个 体 的 占 优 策略 是 选择 合作 而 非 违规 。 
然而 ， 上述 基 于 经 济 学 视角 的 解释 可 能 存在 若干 问题 。 第 一 ， 大 量 研究 表明 人 们 在 决策 
过 程 中 并 不 总 是 遵循 经 济 人 原则 (Alkan, 2020; Camerer & Fehr, 2006; Henrich et al., 2001), 
因此 , 除非 我 们 先入 为 主 地 预 设 违规 者 恰好 总 是 纯粹 理性 的 经 济 人 ,否则 单纯 从 经 济 角 度 很 
难 充分 解释 第 三 方 惩罚 对 违规 的 抑制 作用 ， 而 这 个 预 设 是 否 合理 尚 有 探讨 空间 。 第 二 ， 先 前 
有 研究 者 发 现 惩 习 者 的 动机 显著 影响 了 繁 避 的 作用 ( 谢 东 杰 ， 苏 彦 捷 ,2019;Raihani & Bshary, 
2015)， 如 Rand 等 《2009) 指出 ， 惩 罚 是 否 被 认为 合理 可 以 极 大 地 影响 受罚 者 的 反应 ; 而 
Fehr 和 Rockenbach (2003) 也 注意 到 ， 当 惩 昼 被 认为 是 出 于 自 利 (比如 您 罚 是 为 了 获取 更 
多 的 个 人 利益 ), 尽管 惩 神 能 显著 降低 违规 收益 (减少 的 金额 等 于 初始 金额 的 40%), 但 受罚 
的 违规 者 并 没有 表现 出 更 高 的 合作 水 平 , 结果 恰恰 相反 ,其 合作 水 平 明显 下 降 了 。 如 果 惩罚 
促进 合作 主要 是 由 于 其 降低 了 违规 收益 ,那么 上 述 发 现 便 难以 得 到 合理 的 解释 。 第 三 ， 如 果 
惩罚 对 违规 的 抑制 作用 主要 在 于 提高 了 违规 成 本 , 那么 有 理由 认为 , 除非 在 任何 情况 下 违规 
d 都 会 受到 惩罚 ， 否 则 曾经 受罚 的 经 历 不 足以 使 个 体 在 新 情境 下 自动 表现 得 更 好 。 然 而 ， 正 如 
Shreedhar “ (2018) 指出 ， 如 果 一 个 群体 必须 对 任何 违规 都 实施 惩罚 ， 这 个 群体 将 付出 极 
为 高 昂 的 代价 ， 这 部 分 代价 甚至 超过 了 惩罚 所 来 的 积极 作用 。 换 言 之 ,无 处 不 在 的 惩罚 不 仅 
无 法 维持 大 规模 社 群 中 的 合作 行为 ， 反 而 会 导致 这 类 群体 在 竞争 中 失去 优势 。 
基于 上 述 原因 , 我 们 认为 纯粹 的 经 济 学 观点 不 足以 充分 解释 第 三 方 惩罚 对 合作 规范 的 维 
系 作 用 。 陈 思 静 等 (2015) 基于 社会 规范 聚焦 理论 (focus theory of normative conduct) (Cialdini 
et al., 1991) 提出 第 三 方 惩罚 本 身 即 是 一 种 社会 规范 的 激活 过 程 ， 这 为 我 们 更 好 地 理解 第 三 
方 惩罚 提供 了 另 一 种 理论 起 点 。 社 会 规范 聚焦 理论 认为 ， 人 们 做 出 违规 行为 可 能 只 是 没有 意 
识 到 存在 某 种 规范 ， 因 此 ， 只 要 通过 某 种 方式 让 规范 成 为 人 们 的 意识 焦点 ， 便 可 以 显著 降低 
人 们 的 违规 行为 。 事 实 上 ,有 研究 者 基于 上 述 角度 发 现 第 三 方 惩罚 确实 能 起 到 激活 社会 规范 


的 作用 ( 陈 思 静 等 ,2015)， 而 Chen 等 〈2020) 也 注意 到 ， 第 三 方 惩罚 能 够 显著 地 影响 人 们 
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的 规范 感知 。 然 而 ， 在 先前 研究 中 第 三 方 惩罚 通常 改变 了 违规 者 的 收益 结构 ， 这 意味 着 先前 
究 者 未 能 严格 区 分 第 三 方 惩罚 的 两 种 功能 : 通过 降低 违规 收益 来 提升 合作 (惩罚 的 经 济 效 
DL) 以 及 通过 激活 社会 规范 来 提升 合作 (惩罚 的 规范 效应 )。 本 文 拟 在 这 方面 为 现 有 文献 提 
供 有 益 补充 , Hr zi. 本 文 将 于 实验 1 中 在 控制 违规 者 收益 的 情况 下 检验 第 三 方 惩罚 的 规 
范 激 活 功能 。 如 果实 验 结果 显示 ， 尽 管 惩罚 并 未 降低 违规 者 的 收益 ， 但 受罚 的 违规 者 依然 表 
现 出 了 较 高 的 合作 行为 ,那么 我 们 就 可 以 在 一 定 程度 上 认为 , 惩罚 的 规范 效应 是 一 种 独立 于 
经 济 效应 的 功能 , 并且 为 社会 规范 聚焦 理论 提供 了 新 的 实证 证 据 : 激活 人 们 的 规范 就 可 改变 
其 行为 。 

其 次 ， 人 类 社会 的 合作 表现 出 长 时 间 和 大 规模 的 特点 〈Bingham, 1999)， 而 如 果 惩 罚 的 
作用 仅仅 体现 为 受罚 者 本 人 在 某 个 特定 场景 下 的 合作 规范 被 激活 从 而 提高 了 合作 水 平 , 那么 
我 们 又 陷入 了 类 似 用 经 济 学 观点 去 解释 合作 的 理论 困境 : 假如 必须 通过 惩罚 对 每 个 个 体 在 每 
个 场景 下 进行 规范 提示 , 那么 社会 的 运行 成 本 会 变 得 极 高 ， 从 而 使 第 三 方 惩罚 失去 存在 的 意 
义 〈Shreedhar et al., 2018)。 因 此 ， 我 们 推测 第 三 方 惩罚 的 规范 提示 作用 不 仅 体现 为 抑制 了 
违规 者 当下 的 自私 行为 ,而且 这 一 规范 激活 的 效应 还 可 以 延续 至 新 的 场景 (纵向 溢出 效应 或 
时 间 维 度 上 的 溢出 效应 ， 实 验 2) 以 及 目睹 而 非 亲 身 经 历 惩罚 的 旁观 者 〈 横 向 溢出 效应 或 空 
间 维 度 上 的 溢出 效应 ， 实 验 3)， 即 使 在 这 两 种 情况 下 并 不 存在 潜在 的 惩罚 者 。 如 果 上 述 推 
测 成 立 ， 那 我 们 就 可 以 在 一 定 程度 上 解释 为 什么 真实 生活 中 并 非 时 时 刻 刻 发 生 了 第 三 方 征 
罚 ， 但 人 类 社会 的 合作 依然 得 以 有 条 不 率 开 展 的 原因 。 

最 后 , 社会 规范 作为 被 群体 成 员 广 泛 接受 并 区 别 于 法 律 规 章 的 行为 准则 (Cialdini & Trost, 


1998; Forquesato, 2016)， 在 社会 科学 文献 中 通常 被 区 分 为 描述 性 规范 (descriptive norm) 和 


zn 


命令 性 规范 Cinjunctive norm) (Cialdini et al, 1991): 前 者 指 的 是 人 们 在 某 一 方面 的 普遍 行 
为 模式 , 如 合作 的 描述 性 规范 可 理解 为 人 们 所 表现 出 来 的 合作 行为 的 普遍 程度 ; 而 后 者 指 的 
是 人 们 对 某 一 行为 普遍 所 持 赞 成 或 批评 的 态度 , 如 合作 的 命令 性 规范 可 理解 为 人 们 对 他 人 合 
作 行为 的 赞成 程度 。 社会 规范 可 显著 影响 人 们 的 行为 , 如 简化 个 体 的 行为 决策 并 使 个 体 在 面 
对 复杂 、 不 确定 甚至 是 危险 的 情境 时 得 到 行为 上 的 指引 (McDonald & Crandall, 2015)。 但 需 
要 说 明 的 是 , 研究 者 从 不 同 角 度 指 出 了 两 种 规范 在 影响 行为 中 的 区 别 ， 如 Deutsch 和 Gerard 
(1955) 指出 人 们 对 描述 性 规范 的 认 知 加 工 速 度 要 高 于 对 命令 性 规范 的 加 工 ， 因 此 ， 描述 性 
规范 通常 更 容易 对 行为 产生 影响 ， 而 Petty 和 Cacioppo (1986) 从 个 人 卷 入 度 (personal 
involvement) 比较 了 两 种 规范 对 行为 的 影响 ， 并 指出 当 个 人 卷 入 度 较 高 时 ， 命 令 性 规范 的 作 


用 更 大 。 就 本 文 而 言 ， 一 个 值得 探讨 的 问题 是 当 惩 神通 过 激活 社会 规范 来 影响 合作 时 ， 惩 如 
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激活 了 其 中 一 种 规范 还 是 两 种 规范 都 有 所 激活 ? 如 果 两 种 规范 都 被 激活 了 , 那么 它们 是 否 
有 不 同 的 作用 机 制 ? 我 们 将 在 实验 2 和 3 中 详细 探讨 这 些 问题 。 此 外 ,由 于 社会 规范 聚焦 
论 的 重点 考察 对 象 是 描述 性 规范 , 如 果 我 们 的 实验 结果 表明 , 在 惩罚 通过 激活 规范 而 影响 
和 的 过 程 中 , 命令 性 规范 也 被 激活 并 产生 了 显著 影响 , 那么 本 文 的 结果 也 可 在 一 定 程度 上 
被 视 为 对 这 一 理论 的 有 益 补充 。 
基于 对 上 述 文献 的 回顾 ， 我 们 提出 以 下 研究 问题 作为 本 文 的 主要 探索 目标 : 

研究 问题 1: 当 第 三 方 惩罚 无 法 降低 违规 者 收益 时 ， 是 否 依然 能 有 效 减少 〈 促 进 ) 违规 
(合作 ) 行为 ? 《实验 1) 
研究 问题 2: 第 三 方 惩 避 通过 规范 激活 而 提升 合作 的 作用 是 否 能 溢出 到 新 的 情境 ? K 


验 2) 


并 gm 
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研究 问题 3: 第 三 方 惩罚 通过 规范 激活 而 提升 合作 的 作用 是 否 能 溢出 旁观 者 身上 ? ( 实 
验 3) 

研究 问题 4: 描述 性 和 命令 性 规范 在 惩罚 通过 规范 激活 影响 合作 的 过 程 中 是 否 具 有 相似 
的 作用 机 制 ? (实验 2 和 3) 
概括 而 言 ,， 本 文 拟 从 社会 规范 的 视角 来 解释 第 三 方 惩罚 对 合作 的 影响 机 制 : 我 们 认为 规 
范 激 活 是 第 三 方 惩罚 的 一 种 独立 功能 ， 即 便 无 法 降低 违规 收益 ， 第 三 方 惩 避 依然 可 以 抑 于 
(促进 ) 个 体 的 违规 (合作 ) 行为 (实验 1)， 同 时 ， 这 一 效应 还 溢出 到 了 缺乏 惩罚 机 制 的 新 
场景 中 (实验 2) 和 目睹 惩罚 行为 的 旁观 者 上 (实验 3)。 此 外 ， 我们 还 检验 了 两 种 规范 在 上 


述 过 程 中 的 作用 机 制 (实验 2 和 3)， 并 讨论 了 这 些 发 现 的 理论 和 现实 意义 。 


= 


2 实验 1: 惩罚 的 规范 效应 
2.1 被 试 
取 中 等 效应 量 f= 0.25， 显 著 性 水 平 a = 0.05， 通 过 软件 G* Power3.1 进行 的 功效 分 析 


(power analysis) 显示 ，3 组 间 单 因素 方差 分 析 至 少 需要 252 名 被 试 才能 达到 95% (1 - [D 
的 统计 检验 力 。 考 虑 到 本 实验 采用 了 “4+1” 的 实验 设计 ， 每 5 名 被 试 中 有 4 名 被 试 的 数据 
是 进行 统计 分 析 的 有 效 数据 详情 见 2.2 部 分 )。 我 们 共 招 募 了 315 名 来 自 浙江 工商 大 学 不 
同 专业 的 本 科 生 。 所 有 被 试 在 实验 开始 前 详细 阅读 了 实验 说 明 并 签署 了 知情 同意 书 。 实验 正 
式 开始 前 我 们 通过 若干 练习 题 使 被 试 熟悉 了 实验 规则 《例题 见 附录 )。 用 于 统计 分 析 的 252 


名 有 效 被 试 平 均 年 龄 为 21.42+2.25 岁 ， 其 中 女性 占 比 为 58.33%， 被 试 的 专业 分 布 如 下 : FE 
工科 占 34.92%、 社 会 科学 占 28.57%、 人 文学 科 占 25.40%、 艺 术 及 其 他 占 11.11%。 
2.2 设计 与 程序 

实验 1 为 3 对照 组 、 高 收益 组 和 低 收益 组 ) 组 间 因 子 设计 。 实 验 1 的 范式 为 公共 物品 
博弈 ， 通 过 z-Tree 上 机 实验 的 方式 完成 (Fischbacher, 2007)。 实 验 期 间 ， 被 试 位 于 单独 隔 间 
内 ， 相 互 间 无 法 交流 。 实 验 1 中 每 5 人 组 成 一 个 小 组 进行 博弈 ， 其 中 4 人 为 参与 者 ， 参 与 公 
共 物 品 博弈 ， 剩 余 1 人 为 执行 者 !， 执 行者 不 参与 博弈 ， 其 在 对 照 组 中 扮演 收 税 人 的 角色 ， 
而 在 其 他 两 种 实验 条 件 下 则 扮演 惩罚 人 。 为 了 排除 直接 互惠 〈direct reciprocity) (Trivers, 
1971)》、 间 接 互惠 (indirectreciprocity)(Nowak & Sigmund, 1998) 和 高 成 本 信和 号 (costly signaling) 
(Gintis etal., 2001) 等 机 制 的 潜在 影响 , 在 每 一 轮 博弈 中 , 4 名 参与 者 被 随机 编号 为 A、B、 


> C, D, 而 执行 者 的 编号 始终 是 E， 小 组 成 员 都 由 计算 机 随机 安排 , 但 参与 者 和 执行 者 的 角色 
> 不 能 互 换 。 每 一 轮 博弈 结束 时 告知 被 试 该 组 每 个 成 员 在 该 轮 博弈 中 的 贡献 和 收益 (在 有 惩罚 
e 条 件 下 ， 反 馈 还 包括 惩罚 情况 )， 但 是 在 新 一 轮 的 博弈 中 ， 被 试 并 不 知晓 同 组 成 员 在 过 去 博 
co 弈 中 的 表现 。 另 外 ， 为 了 避免 尾 轮 效应 Cend effect)， 被 试 事前 并 不 知晓 博弈 轮 数 。 

= 实验 开始 后 ,被 试 被 随机 平均 分 入 3 种 实验 条 件 : 对 照 组 Cn= 84)、 高 收益 组 Cn= 84) 
= 和 低 收 益 组 Cn=84)。 在 对 照 组 中 ， 每 个 被 试 〈 包 括 参与 者 A/B/C/D 和 执行 者 E) 在 实验 开 


4 
aff 


台 前 拥有 25 代 币 《相当 于 5 人 民 币 ) 的 初始 金额 。 在 每 一 轮 博弈 中 ， 参 与 者 自由 决定 是 否 
将 初始 金额 中 的 10 代 币 投入 公共 账户 中 ， 而 投入 公共 账户 的 代 币 翻 倍 后 平均 分 给 小 组 所 有 
参与 者 。 对 于 参与 者 而 言 ， 占 优 策略 是 选择 保留 初始 金额 〈 违 规 ) 并 尽 可 能 让 他 人 将 代 币 投 
入 公共 账户 ， 而 非 将 10 个 代 币 投入 公共 账户 “合作 )。 但 是 ， 如 果 每 人 都 这 样 做 的 话 ， 最 终 
每 个 人 的 收益 反而 降低 了 。 此 外 ， 参 与 者 被 告知 ， 选 择 保 留 10 代 币 的 话 则 需要 向 成 员 E 缴 
28 工 代 币 的 收入 税 ， 该 金额 不 进入 公共 账户 ， 也 不 返还 给 任何 成 员 。 完 成 上 述 步骤 后 随即 进 
一 轮 ， 总 共 进 行 10 轮 。10 轮 博 穿 后 实验 结束 ， 实 验 者 对 被 试 进行 反馈 和 支付 报酬 。 
验 报酬 为 10 元 出 场 费 加 上 随机 抽取 一 轮 被 试 手 中 的 代 币 数 (5 代 币 可 换 1 人 民 币 ， 下 同 )。 
高 收益 组 和 低 收 益 组 的 实验 流程 和 对 照 组 基本 类 似 ， 主 要 区 别 在 于 这 两 种 实验 条 件 下 ， 
在 计算 机 反馈 参与 者 的 选择 后 ,成 员 E 可 惩罚 违规 者 ?; 1) 高 收益 组 中 ， 如 果 执 行者 选择 惩 


! 为 了 避免 某 些 词语 可 能 带 有 的 感情 色彩 对 被 试 产 生 影响 ， 在 实验 中 “参与 者 ^“ 执 行者 ”或 “惩罚 ”等 词 

均 被 “角色 A/B/C/D”“ 和 角色 E” 和 “ 扣 减 ”所 取代 。 

2 在 实验 1 中 ， 被 试 只 能 惩罚 违规 者 ， 即 选择 保留 10 代 币 的 参与 者 ， 这 一 设置 是 为 了 避免 反 社会 惩罚 
(antisocial punishment) 一 一 针对 合作 者 的 惩罚 (Herrmann et al., 2008) 一 一 对 实验 结果 的 干扰 。 
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WRT HD) 参与 者 ， 那 么 他 /她 每 惩罚 一 次 需 支 付 5 代 币 ， 而 受罚 者 只 需 支 付 1 代 币 作为 
违规 成 本 ， 因 此 违规 收益 较 高 ; 2) 在 低 收益 组 中 ， 执 行者 支付 5 代 币 而 受罚 者 支付 10 代 币 
作为 违规 成 本 ， 因 此 违规 收益 较 低 。 在 每 一 轮 中 ,执行 者 可 同时 惩罚 多 名 违规 者 ， 但 对 每 一 
位 违规 者 只 能 惩罚 一 次 。 在 被 试 完成 惩罚 决定 后 , 计算 机 公布 上 述 决 定 及 每 个 被 试 在 本 轮 中 
的 收益 。 表 1 总 结 了 三 种 实验 条 件 下 参与 者 在 某 轮 博弈 中 选择 合作 /违规 的 收益 。 

A 1 不 同 实验 条 件 下 合作 与 违规 的 收益 


实验 条 件 Uc Up 

对 照 组 25,2 088710 ag 25254 

高 收益 组 ga 5 PRIME. A: -10 252 y Xp 
低 收益 组 25,2 0089 ag 25+ 0C. 10xp 


注 ; Uc 表示 选择 合作 的 收益 :Up 表示 选择 违规 的 收益 ;xc 表示 其 他 选择 合作 的 人 数 (xcE{0,1,2,3]); xp 
TUERM (xp € (0,1. 


实验 1 重点 在 于 比较 高 收益 组 和 对 照 组 被 试 的 合作 水 平平 均 每 轮 投入 公共 账户 的 钱 
数 )。 从 表 1 可 以 看 出 ， 这 两 组 的 合作 收益 是 一 样 的 ， 差 别 在 于 违规 收益 ， 并 且 高 收益 组 的 
违规 收益 大 于 等 于 对 照 组 ， 因 为 公式 中 Xo<1， 根 据 纯粹 理性 人 的 观点 ， 相 比 于 对 照 组 ， 高 
收益 组 被 试 更 有 动力 去 选择 违规 , 我 们 应 该 能 观察 到 高 收益 组 的 合作 水 平 低 于 对 照 组 .其 次 ， 

过 比较 低 收益 组 被 试 和 高 收益 组 被 试 的 合作 水 平 ,我 们 可 以 在 一 定 程度 上 考察 经 济 因 素 对 
抑制 违规 行为 的 作用 , 因为 这 两 组 被 试 的 唯一 差别 在 于 低 收 益 组 被 试 的 违规 成 本 远 高 于 高 收 
益 组 (前 者 是 后 者 的 10 倍 )。 

2.3 结果 与 讨论 

不 同性 别 (t=0.83,p=0.408) 和 专业 (F=1.54,p=0.204) 下 合作 水 平 的 差异 不 显著 ， 
年 龄 与 合作 水 平 (r=-0.03,p=0.597) 的 相关 系数 不 显著 。 运 用 单 因 素 方差 分 析 比 较 三 组 被 
试 的 合作 水 平 ， 结 果 显 示 ， 三 组 被 试 的 合作 水 平 存 在 显著 差异 CF = 15.24, p«0.001, d= 
0.65, 9594C.I. 7 [0.38, 0.92])。 多重 比 较 (Tukey 法 ) 的 结果 表明 : 高 收益 组 被 试 CM= 4.75， 


SD=2.57, n=84) 的 合作 水 平 显 著 高 于 对 照 组 (M=3.55, SD=2.80, n=84) (p=0.012, 


95%C.L = [0.22，2.19])， 而 低 收 益 组 被 试 (M = 5.86，SD = 2.76，n = 84) 的 合作 水 平 显 著 


高 于 对 照 组 (p < 0.001, 95%C.1. = [1.32，3.30]) 和 高 收益 组 (p= 0.023，95%C.I = [0.12, 
2.09])。 图 1 直观 地 显示 了 三 组 被 试 合作 水 平 的 差异 。 
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收益 组 被 试 的 合作 水 平 显著 高 于 高 收益 


对 照 组 — mk 


益 组 ” 低 收 益 组 


ik: *p<0.05 


图 1 三 组 被 试 的 合作 水 平 


述 结果 一 方面 验证 了 降低 违规 收益 对 提高 


违规 行为 的 过 程 中 ， 基 于 成 本 -收益 的 经 济 考虑 确实 发 挥 了 显著 的 作用 。 这 一 点 体现 在 了 


[£ 


合作 水 平 的 重要 性 , 也 就 是 说 , 在 惩罚 抑制 


低 


这 意味 着 通过 第 三 方 惩罚 改变 违规 者 的 收益 结构 


确实 可 以 激励 人 们 减少 违规 行为 从 而 提升 了 合作 水 平 (Ballietetal.,2011; Gachter etal.,2008 ). 


但 从 男 一 方面 来 说 ， 和 我 们 预期 相似 ,经济 因 


收益 组 和 对 照 组 违规 收益 (Up) 可 以 看 出 , 高 收益 


对 照 组 ， 


而 事实 上 ， 高 收益 


方 惩罚 并 没有 本 质 上 降低 高 收益 组 违规 者 的 收益 ， 


这 意味 着 惩 避 降低 违规 行为 的 心理 机 制 不 仅仅 是 
6 说 ， 人 们 在 决策 过 程 中 并 非 总 
之 个 结果 可 能 违反 了 我 们 的 直觉 


Hj. 实验 1 也 在 一 定 程度 上 支持 了 聚焦 理论 
而 只 是 没有 意识 到 某 种 规范 的 存 
组 和 对 照 组 的 实验 条 件 ， 唯 一 的 差别 在 于 违规 成 本 : 高 收益 组 为 Xp， 而 对 照 


为 了 追求 利益 ， 
对 比 高 收益 
为 1，Xp<1, 但 Xp 对 违规 的 抑制 作用 却 更 高 ， 因 此 


违规 者 身上 ， 尽 管 这 
通过 回答 研究 问题 1， 即 第 三 方 惩 罚 对 合作 的 促进 并 不 完全 取决 于 其 降低 违规 收益 的 作 


他 重要 因素 。 换 句 训 


组 被 试 选择 违规 的 预期 收益 总 是 大 于 等 


但 依然 可 以 有 效 地 抑制 违规 (促进 合作 )。 


素 无 法 完全 解释 实验 1 的 结果 。 对 比 表 1 中 高 


Cc 


EIE, WARAN EE, RR HE S Cb AEE (合作 )。 然 
组 被 试 合 作 水 平 却 显 赣 高 于 对 照 组 ， 这 说 明 相 较 于 对 照 组 而 言 ， 即 使 第 三 


其 改变 了 违规 者 的 收益 结构 , 一 定 还 存在 
是 遵循 经 济 人 假设 这 一 原则 同样 可 应 用 


Jl o 


Æ (Cialdini et al., 1991)。 就 实验 1 而 言 


， 有 理由 认为 抑制 违规 作用 的 差别 主要 


来 自 两 种 成 本 的 质 的 差异 而 非 量 的 差异 : 表现 为 惩罚 的 违规 成 本 提示 了 人 们 对 违规 行为 持 


德 批 讨 


的 态度 ， 从 而 激活 了 人 们 有 关 合作 的 和 
收入 税 的 违规 成 本 却 相 对 中 性 ， 缺 乏 这 一 功能 。 
7 


会 规范 《〈《 陈 思 静 等 ,201$)， 而 对 照 组 中 表 刀 


在 


的 观点 : 很 多 时 候 人 们 做 出 违规 行为 并 不 是 单纯 


组 


a 


i 


见 为 


另外 ， 尽 管 先前 也 有 研究 Cg, BWER, 


2015; Chen et al, 2020) eH AA MERA Ae, fBg TEXAS, RET 
因而 无 法 在 严格 意义 上 回答 下 列 问 题 : 当 第 三 方 惩罚 不 足以 改变 
和 效 地 促进 合作 ? 实验 1 首次 通过 随机 对 照 实验 控制 了 经 
向 ， 从 而 为 第 三 方 惩罚 的 规范 提示 作用 提供 了 明确 


会 影响 受罚 者 的 经 济 利益 ， 


违规 者 的 收益 结构 时 ， 


济 收益 对 实验 结果 的 影 


mo 


j 总 是 


by aes) 
是 否 还 能 


的 实证 证 据 , 这 意 


味 着 惩罚 的 规范 效应 并 非 需 要 经 济 效应 为 前 提 ， 这 对 现 有 研究 的 结论 是 一 个 有 力 的 补充 。 


3 实验 2: RET ERE TE WIAA E tt CY, 


实验 1 为 第 三 方 惩罚 纯粹 的 规范 提示 功能 提供 


Sil 


F 据 ， 实 验 2 进一步 检验 惩罚 提升 合 


作 的 功能 是 否 能 溢出 到 不 存在 惩罚 机 


JE F 


开 比 较 描述 性 和 命令 性 规范 的 作用 机 


H, AME 
3.1 被 试 

来 
了 知情 


著 性 水 平 a = 0.05, 


| G*Power3.1 itf 


自 不 同 专业 的 300 名 学 生 参 加 了 实验 2， 
同意 书 。 实 验 2 需要 首先 筛选 出 违规 者 。 根 据 实验 1 差异 比较 的 结果 d= 0.65， 取 显 


答 本 文 所 提出 的 研究 问题 2 和 4。 


在 实验 开始 前 详 


| 阅读 了 实验 说 明 并 签署 


出 实验 2 至 少 需 要 由 104 名 违规 者 组 成 的 样本 才能 


达到 95% C1- po 的 统计 检验 力 ， 而 通过 实验 2 阶段 一 的 操作 ,我 们 总 共 得 到 了 179 名 违规 


者 。 这 179 名 被 试 平均 年 


T: EET 
32 设计 与 程序 


35.75%, 


4573 21.304 1.97 岁 ， 其 中 女性 占 比 为 54.19%， 被 试 的 专业 分 布 如 


社会 科学 占 31.84%、 人 文学 科 占 


24.02%、 艺 术 及 其 他 占 


8.3896. 


32.1 第 一 阶段 ， 有 第 三 方 的 独裁 者 博弈 


实验 2 为 2 对照 组 vs. 惩罚 组 ) 组 间 因 子 设计 。 实 验 2 的 范式 为 带 有 第 三 方 的 独裁 者 


博弈 。 在 阶段 一 中 ， 被 试 被 告知 他 /她 将 与 其 他 2 名 被 试 组 成 一 个 小 组 来 完成 5 轮 独裁 者 博 
弈 。 在 5 轮 博弈 中 ， 被 试 均 扮演 分 配 者 ， 而 扮演 接受 者 和 第 三 方 的 2 名 被 试 实际 是 虚拟 被 


试 ， 即 由 


实验 者 事先 设 定 的 计 自 


接受 者 和 


间 自 由 分 配 , 而 接受 者 无 权 反 对 , 但 第 三 方 可 对 其 认为 不 公平 的 方案 进行 惩罚 ， 


Ae 一 


"m 


机 程序 3。 此 外 , 被 试 还 被 告知 每 一 轮 博弈 开始 前 ， 分 配 者 、 


记分 别 拥有 10、0 和 2 代 币 的 初始 金额 , 分配 者 可 将 初始 金额 在 其 和 接受 者 之 


惩罚 规则 为 


第 三 方 付 出 2 代 币 扣 减 分 配 者 6 代 币 。 另 外 ,被 试 还 通过 指导 语 了 解 到 在 每 一 轮 博弈 中 , 小 


组 成 员 都 是 由 


i$ 


机 随机 选择 的 ， 并 


日 每 轮 博 穿 均 无 结果 反馈 。 在 实际 操作 中 ， 基 于 先前 文 


献 的 结论 (Csukly etal., 2011; Fehr & Fischbacher, 2003)， 判 断 被 试 的 分 配方 案 是 否 违规 的 标 


? 在 实验 指导 语 


FP 分 配 者 、 接 受 者 和 第 三 方 分 别 用 角 


色 A、 角 色 B 和 角色 C 代替 ， 下 同 。 


8 


104v1 


di 


103 


:202 


V 


chinaXI 


准 如 下 : 当 被 试 分 配给 接受 者 的 金额 小 于 初始 金额 的 30% 时 ， 分 配方 案 即 被 判定 为 违规 ， 反 
之 即 为 合作 。 完 成 上 述 5 轮 博 弈 后 ， 共 有 179 名 被 试 在 5 轮 博弈 中 至 少 有 过 一 次 违规 行为 ， 
这 些 被 试 在 阶段 二 中 被 随机 分 入 两 组 : 90 被 试 被 告知 其 在 过 去 5 轮 博 奔 中 受到 了 来 自 第 三 
方 的 惩 习 (惩罚 组 )， 而 剩余 的 S9 名 被 试 则 没有 任何 反馈 (对 照 组 ) ^. 

3.2.2 第 二 阶段 :独裁 者 博弈 和 公共 物品 博弈 

分 组 后 ， 对 照 组 和 惩罚 组 被 试 完成 以 下 任务 : 1) 与 其 他 1 名 被 试 共同 完成 1 轮 无 第 三 
方 的 独裁 者 博弈 ,在 博弈 中 他 们 将 继续 扮演 分 配 者 ， 但 分 配方 法 与 前 一 阶段 有 所 不 同 : 每 个 
被 试 拥有 20 代 币 的 初始 金额 ， 他 们 可 自由 选择 初始 金额 的 一 部 分 (0-10. 之 间 的 任 一 整数 ) 
分 配给 接受 者 ， 并 且 被 试 被 明确 告知 不 管 他 /她 的 分 配方 案 如 何 ， 都 不 会 遭受 惩 避 ; 2) 与 其 
他 3 名 被 试 共同 完成 1 轮 无 第 三 方 的 公共 物品 博弈 ， 在 博弈 中 他 们 可 自由 地 将 20 代 币 初始 
金额 的 一 部 分 (0~20 之 间 的 任 一 整数 ) 投入 公共 账户 , 投入 公共 账户 的 金额 将 翻 倍 后 在 4 名 
成 员 中 平均 分 配 ， 并 且 被 试 被 明确 告知 不 管 他 /她 的 选择 如 何 ， 都 不 会 遭受 惩罚 。 为 了 避免 
顺序 对 结果 的 潜在 影响 ， 一 半 被 试 先 阅读 有 关 独 裁 者 博弈 的 指示 语 ， 另 一 半 被 试 顺序 相反 。 
接着 ， 被 试 分 别 估计 在 独裁 者 博弈 中 : 1) 将 0、1、2.…10 代 币 分 配给 接受 者 的 被 试 的 百 分 
Lk; 2) 赞成 将 0、1、2...10 代 币 分 配给 接受 者 的 被 试 的 百分比 ; 3) 从 0~10 选择 一 个 整数 
代表 自己 愿意 分 配给 接受 者 的 金额 ; 以 及 在 公共 物品 博弈 中 : 4) 从 0-20 选择 一 个 整数 代表 
自己 愿意 投入 到 公共 账户 的 金额 。 完 成 上 述 步骤 后 ， 实 验 者 宣布 实验 结束 ， 并 对 被 试 进行 反 
馈 和 支付 报酬 。 实 验 报 酬 为 10 元 出 场 费 加 上 随机 抽取 一 轮 被 试 手中 的 代 币 数 。 

我 们 用 两 种 方式 来 测量 被 试 在 博弈 中 描述 性 和 命令 性 规范 的 激活 水 平 : 第 一 种 采 月 
Chen “ (20200 的 方法 ， 用 D 和 2) 这 两 项 各 自 的 加 权 平 均值 分 别 作为 描述 性 规范 和 命令 
性 规范 激活 水 平 的 操作 定义 ;在 第 二 种 方法 中 ， 我 们 采用 Bicchieri 和 Xiao (2009), Voisin 
等 (20160 以 及 Sood 等 (2020) 的 范式 ， 即 使 用 被 试 对 某 个 行为 或 赞成 菜 个 行为 普遍 程度 
的 估计 来 代表 被 试 的 描述 性 或 命令 性 规范 的 激活 水 平 , 具体 而 言 ， 即 有 多 少 比例 的 分 配 者 将 
CE BCE) 20 代 币 中 的 7、8、9 和 10 代 币 分 配给 接受 者 ， 以 此 作为 两 种 规范 激活 水 平 的 操 
作 定 义 5。 在 统计 分 析 中 我 们 主要 采用 第 一 种 操作 定义 来 检验 研究 问题 ， 并 采用 第 二 种 操作 


ao 


4 在 阶段 一 中 没有 违规 行为 的 121 名 被 试 不 再 参与 下 一 阶段 实验 ， 但 为 了 保证 实验 的 顺利 进行 ， 这 些 被 试 
被 告知 接 下 去 他 们 将 完成 一 轮 旨 在 测试 “外 语 思 维 对 规范 感知 的 影响 ”的 实验 ， 有 具体 任务 为 阅读 一 份 由 英 
语 写作 的 关于 非洲 某 部 落 礼物 交换 规范 的 短文 并 回答 相应 问题 。 
5 先前 有 相当 文献 表明 在 不 同文 化 语 境 中 人 们 对 于 什么 样 的 分 配方 案 算 是 违规 /合作 有 高 度 稳定 的 看 法 ， 即 
分 配给 对 方 的 金额 约 小 于 30% 是 一 种 违规 行为 《Csukly et al., 2011, Fehr & Fischbacher, 2003)， 且 有 学 者 认 
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定义 作为 稳健 性 检验 , 考察 在 两 种 操作 定义 下 结果 是 否 有 质 的 差别 ,从 而 增强 研究 结论 的 说 
服 力 。 

最 后 ， 根 据 黄 少 安 和 张 苏 (2013) 对 合作 所 下 定义 : 合作 是 自己 付出 成 本 而 使 其 他 人 或 
者 公共 物品 受益 的 行为 ， 我 们 用 上 述 3) 和 4) 项 数字 分 别 表示 被 试 在 两 种 博弈 情形 下 的 合 
作 水 平 〈 在 独裁 者 博弈 中 ,合作 意味 着 使 对 方 受益 ; 而 在 公共 物品 博弈 中 ,合作 意味 着 自己 
的 行为 提高 了 公共 物品 的 产 出 )， 数 字 越 大 表示 合作 水 平 越 高 。 

结果 与 讨论 

我 们 首先 使 用 规范 激活 水 平 的 第 一 种 操作 定义 进行 了 统计 分 析 , 结果 发 现 , 不 同性 别 Ct 
= 0.07~1.26, p = 0.209~0.941) 和 专业 CF = 0.18~1.43, = 0.236~0.911) 下 描述 性 规范 、 命 令 
性 规范 和 合作 水 平 的 差异 均 不 显著 ,年 龄 与 描述 性 规范 、 命 令 性 规范 与 合作 水 平 (x = 
0.03~0.05, p= 0.540~0.736) 的 相关 系数 不 显著 。 如 图 2 所 示 ， 惩 罚 组 被 试 的 描述 性 规范 激活 


水 平 (M= 3.80, SD=2.45, n=90) 显著 高 于 对 照 组 (M=2.83, SD=1.85, n=89) (t= 


2.97, p- 0.003，d= 0.44，95%C.I = [0.15，0.74]); 惩罚 组 被 试 的 命令 性 规范 激活 水 平 (M 


—5.62, SD-2.79) 显著 高 于 对 照 组 (M=4.10, SD=2.56) (t=3.82, p<0.001, d=0.57, 


95%C.I. = [0.27, 0.87]); 此 外 , 惩罚 组 被 试 在 独裁 者 博弈 中 的 合作 水 平 CM=3.5$, SD= 2.83) 


也 显著 高 于 对 照 组 CM — 2.46, SD=2.75) (£— 2.59, p—0.009, d=0.39, 95%C.I. = [0.09， 
0.68])。 上 述 结果 为 研究 问题 2 提供 了 初步 回答 ， 我 们 发 现 第 三 方 惩罚 不 仅 显 著 激 活 了 违规 


者 的 两 种 社会 规范 , 而 且 提 升 了 违规 者 在 新 情境 下 的 合作 水 平 。 在 第 二 阶段 的 独裁 者 博弈 中 ， 

不 存在 可 能 实施 惩罚 的 第 三 方 , 而 且 对 照 组 和 实验 组 的 唯一 的 差别 就 在 于 实验 组 被 试 在 第 一 

"T 阶段 结束 时 被 提醒 过 其 违规 行为 受到 了 惩罚 ， 因 而 对 实验 2 结果 的 合理 解释 是 第 三 方 惩罚 
的 规范 提示 功能 溢出 到 了 新 的 情境 下 , 在 这 种 情况 下 即便 不 存在 惩罚 机 制 , 但 激活 了 的 社会 
规范 依然 可 以 提升 违规 者 的 合作 水 平 。 

此 外 , 我 们 使 用 规范 激活 水 平 的 第 二 种 操作 定义 重复 了 上 述 检验 过 程 , 并 得 到 了 相似 的 
结果 : 惩罚 组 被 试 的 描述 性 规范 激活 水 平 显著 高 于 对 照 组 (1= 418. p < 0.001); 惩罚 组 被 
试 的 命令 性 规范 激活 水 平 也 显著 高 于 对 照 组 (t= 4.80, p < 0.001)。 上 述 结果 意味 着 我 们 的 
研究 结论 具有 较 高 的 稳健 性 。 


ri 


为 这 种 在 划分 标准 上 的 稳定 性 具有 一 定 的 生物 学 基础 (Wallace etal.,2007)。 以 初始 金额 (20 代 币 ) 30% 计 
算 ，6 代 币 为 分 界 点 ， 也 就 是 说 高 于 6 代 币 的 分 配方 案 可 被 认为 是 一 种 合作 行为 。 
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为 回答 研究 问题 4( 两 种 规范 在 和 您 罚 提 升 合作 中 是 否 上 共有 不 同 机 制 ?), 我 们 进一步 探讨 
了 惩罚 影响 合作 的 心理 机 制 ， 以 是 否 受过 惩 习 为 自 变 量 、 描 述 性 规范 和 命令 性 规范 为 中 介 变 


in| 


量 、 合 作 水 平 为 因 变 量 ; 


行 中 介 效 应 检验 。 需要 说 明 的 是 ， 有 研究 者 指出 用 偏差 校正 的 非 参 


数 百 分 位 bootstrap 法 计算 系数 乘积 的 置信 区 间 比 Sobel 法 得 到 的 置信 区 间 更 精确 ( 方 杰 , 张 
敏 强 , 2012; WER, IEW, 2014)， 因 此 我 们 使 用 Preacher 和 Hayes (2004) 所 开发 


PROCESS3.5 插件 进行 中 介 效 应 检验 (Model 4)。 


检验 结果 如 表 2 所 示 : Mi Mo 中 惩罚 对 两 种 规范 都 有 显著 的 影响 。 与 Ms 相 比 ，M4 在 


引入 两 种 规范 后 R 增加 
分 析 惩罚 通过 两 种 规范 对 合作 行为 的 间接 作用 ， 描 述 性 规范 (Effect= 0.37，BootSE = 0.22, 
BootLLCI=0.18, BootULCI=1.06) 和 命令 性 规范 (Effect= 0.26, BootSE=0.13, BootLLCI 


= 0.04，BootULCI = 0.55) 的 置信 区 间 都 不 包含 0， 这 说 明 两 种 规范 对 合作 的 间接 作用 都 显 


du 另 一 方面 ， 是 否 受 


了 0.24， 意 味 着 引入 两 种 规范 能 解释 合作 行为 变异 的 24%。 进 一 步 


过 惩罚 (Effect=0.24, SE=0.39, t=0.64, p=0.523, LLCI=-0.51, 


ULCI-1.01) 置信 区 间 包 含 0， 这 意味 着 惩罚 对 合作 行为 的 直接 作用 不 显著 。 综 上 所 述 ， 惩 


罚 对 合作 行为 的 促 ; 


TER 


在 很 大 程度 上 是 通过 激活 两 种 社会 规范 来 实现 的 , 两 种 规范 的 间接 


效应 占 总 效应 的 77.20%， 其 中 描述 性 规范 的 间接 效应 占 53.08%, 命令 性 规范 占 24.12% (图 
3)， 并 且 两 种 规范 间接 效应 的 大 小 差异 不 显著 CBootSE = 0.09，BootLLCI= -0.01, BootULCI 
=0.30)， 因 此 ， 从 实验 2 的 结果 来 看 ， 两 种 规范 在 中 介 惩罚 与 合作 的 过 程 中 具有 相似 的 作用 


机 制 。 


表 2 中 介 效 应 的 检验 


Mi M2 M3 Ma 
变量 (描述 性 规范 ) (命令 性 规范 ) (合作 行为 ) (合作 行为 ) 
系数 SE 系数 SE 系数 SE 系数 SE 
常数 1.87™* 0.51 2.57" 0.63 1.38* 0.66 -0.17 0.62 
惩罚 0.97™ 0.32 1.53** 0.40 1.08** 0.42 0.25 0.39 
描述 性 规范 0.59*** 0.08 
命令 性 规范 0.17* 0.07 
R MSE R? MSE R? MSE R? MSE 
模型 
0.05 4.72 0.08 7.17 0.04 2.79 0.28 5.91 
注 : FES AAA, **p<0.001, “p<0.01, *p<0.05. 
od HR HELI 
** A icm kkk 
0.97 ~ 0.59 
mad ; hc 
fe Q0 0.25 (1.08 ) d paa ^ 
QUT 


同样 ， 我 们 采用 规范 激活 


YE: ““p<0.001, “p<0.01, "p«0.05. 


图 3 描述 性 与 命令 性 规范 的 中 介 作用 
水 平 的 第 二 种 操作 定义 进行 了 稳健 性 检验 ， 并 在 上 述 检验 过 程 


中 得 到 了 相似 的 结果 : 描述 性 规范 间接 作用 显著 (Effect = 0.76，BootSE = 0.21, BootLLCI 


=0.38, BootULCI= 1.21); 命令 性 规范 间接 作用 显著 (Effect= 0.33, BootSE = 0.16, BootLLCI 


=0.05, BootULCI=0.68); 直 


接 作用 不 显著 (Effect=-0.01, SE=0.41, t=-0.01, p=0.989). 


进一步 检验 被 试 在 阶段 二 公共 物品 博弈 中 的 合作 行为 可 以 加 深 我 们 对 第 三 方 惩罚 游 出 


效应 的 理解 , 分 析 结 果 显 示 : 


惩罚 组 不 仅 在 与 阶段 一 相同 的 独裁 者 博弈 中 合作 水 平 显著 高 于 


对 照 组 ， 在 不 同 于 阶段 一 的 公共 物品 博弈 情境 中 合作 水 平 (M=5.24, SD=5.70, n=90) W] 


样 也 显著 高 于 对 照 组 (M=3. 


=[0.001, 0.592]). ixji8jfE 


与 原 情境 完全 不 同 的 情况 下 o 


76, SD=4.23, n=89) (t=1.97, p=0.050, d=0.30, 9594C.I. 
罚 的 溢出 效应 不 仅 体现 在 与 原 情境 相似 的 新 情境 中 ， 也 表现 在 


进一步 比较 被 试 在 两 种 博弈 情境 中 合作 水 平 的 差异 可 以 让 我 们 
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更 好 地 理解 溢出 效应 的 机 制 。 由 于 独裁 者 博弈 和 公共 物品 博弈 是 两 种 不 同 的 情境 ， 因 此 ， 首 
先 需要 将 被 试 的 合作 水 平 进行 离 差 标 准 化 ， 具 体 而 言 ， 根 据 Peysakhovich 和 Rand (2016) 
以 及 Rand (2014) 的 建议 ， 我 们 把 独裁 者 博弈 中 将 20 代 币 中 的 10 代 币 分 配给 对 方 的 方 
案 设 为 最 大 值 1〈 即 独裁 者 博弈 中 合作 水 平 最 高 的 分 配方 案 )， 分 配给 对 方 0 代 币 则 为 最 小 
值 0〈 即 合作 水 平 最 低 的 分 配方 案 ); 类 似 的 ， 公 共 物 品 博弈 中 将 20 代 币 全 部 投入 公共 账户 
VEA Y ( 即 公 共 物 品 博弈 中 合作 水 平 最 高 的 方案 )， 投 入 0 代 币 《〈 即 合作 水 平 最 低 的 方案 ) 
则 设 为 0。 分 析 结 果 显 示 : 对 照 组 在 独裁 者 博弈 CM=0.19，SD=0.21，7=89) 和 公共 物品 
博弈 中 M=0.24, SD=0.26, n=89) 的 合作 行为 无 显著 差异 (t= 1.53, = 0.127)， 这 在 
一 定 程度 上 说 明 两 种 博弈 范式 本 身 不 会 影响 被 试 的 合作 行为 ; 相反 , 惩罚 组 在 独裁 者 博弈 下 


的 合作 水 平 (M=0.36, SD=0.28, n=90) 显著 高 于 公共 物品 博弈 (M = 0.26，SD = 0.28， 


n=90) (t=2.35, p=0.020, d=0.35, 95%C.I. = [0.06，0.65])。 

上 述 结果 一 方面 进一步 证 实 了 惩罚 的 溢出 效应 , 另 一 方面 也 意味 着 惩罚 通过 激活 社会 规 
范 所 带 来 的 合作 提升 效果 虽然 可 以 跨 情 境 迁 移 ， 但 不 同情 境 下 提升 效果 比 相 同情 境 低 。 这 一 
结果 可 以 通过 Rand 等 〈2014) 所 提出 的 社会 启发 法 假说 (social heuristics hypothesis) 得 到 
解释 : 真实 生活 中 个 体 间 的 互动 往往 是 非 匿 名 的 和 重复 博弈 的 (Dreber et al., 2008; Rand et 
al., 2016)， 从 长 远 来 看 合作 是 更 有 利 的 博弈 策略 ， 长此以往 ， 人 们 内 化 了 这 种 合作 规范 并 直 
觉 性 地 将 之 应 用 到 各 种 情境 中 去 , 但 新 情境 的 不 同 会 激发 个 体 的 有 意识 思考 , 而 通过 这 种 思 
考 人 们 会 发 现 对 自身 利益 而 言 在 新 的 情境 中 合作 未 必 是 最 佳 选 择 (Peysakhovich & Rand, 
2016)， 换 言 之 ， 理 性 思考 会 抑制 个 体 在 新 情境 中 的 合作 行为 。 就 实验 2 的 结果 而 言 ， 当 被 
PT 试 从 第 一 阶段 的 独裁 者 博弈 过 渡 到 第 二 阶段 的 公共 物品 博弈 时 , 个 体 需 要 进行 一 定 的 思考 才 
能 理解 两 者 间 的 相似 与 不 同 ， 而 这 种 理性 思考 降低 了 个 体 在 公共 物品 博弈 中 的 合作 水 平 ; 与 
之 相反 , 第 二 阶段 的 独裁 者 博弈 与 第 一 阶段 的 实验 范式 无 本 质 差 异 , 被 试 无 需 进行 思考 就 能 
做 出 直觉 反应 ， 因 此 合作 水 平 更 高 。 


4 实验 3: 惩罚 促进 合作 的 横 问 溢出 效应 

实验 2 验证 了 第 三 方 惩罚 在 时 间 维度 上 的 溢出 效应 ， 即 第 三 方 惩罚 通过 激活 违规 者 的 
社会 规范 而 提高 了 其 在 后 续 新 情境 下 的 合作 水 平 ,即便 在 新 情境 下 不 存在 对 违规 行为 的 惩罚 
机 制 。 实 验 3 进一步 探讨 第 三 方 惩罚 的 规范 激活 功能 是 否 能 溢出 到 旁观 者 或 潜在 违规 者 身 
上 ， 即 空间 维度 上 的 溢出 效应 ， 并 比较 两 种 规范 的 影响 机 制 ， 从 而 回答 研究 问题 3 和 4。 
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4.1 被 试 
取 中 等 效应 量 f= 0.25, a = 0.05， 运 用 G*Power3.1 进行 的 功效 分 析 显 示 最 少 需要 158 
名 被 试 才能 达到 95% (1 -月 的 统计 检验 力 ， 而 实际 参与 实验 3 的 被 试 为 不 同 专业 的 160 名 
本 科 生 ， 其 平均 年 龄 为 21.9 € 1.93 岁 ， 其 中 女性 占 比 为 42.50%， 被 试 的 专业 分 布 为 : 理工 
科 占 34.38%、 社 会 科学 占 28.13%、 人 文学 科 占 26.25%、 艺 术 及 其 他 占 11.25%。 在 实验 开 
台 前 被 试 仔细 阅读 了 有 关 实 验 的 书面 说 明 并 签署 了 知情 同意 书 。 
4.2 设计 与 程序 
实验 3 为 2 (旁观 前 vs. 旁观 后 ) x2( 违 规 组 vs. 规范 组 ) 混合 设计 。 实 验 开始 前 ， 被 
试 被 告知 他 们 将 观看 1 轮 由 3 名 成 员 参 与 的 独裁 者 博弈 ， 而 被 试 需 在 博弈 完成 后 尽快 计算 
出 各 个 成 员 的 收益 。 在 了 解 博弈 规则 后 (分 配 者 拥有 20 代 币 初始 金额 ， 并 可 将 0~10 之 间 的 
任 一 整数 金额 分 配给 接受 者 , 接受 者 无 权 干 预 , 但 第 三 方 可 支付 2 代 币 来 扣 减 不 公平 分 配 者 


> 的 6 代 币 )， 被 试 被 随机 平均 分 入 两 种 实验 条 件 〈80 名 违规 组 被 试 和 80 名 规范 组 被 试 )， 所 
e 有 被 试 均 被 要 求 估计 在 即将 进行 的 博弈 中 : 1) 将 0、1、2...10 代 币 分 配给 接受 者 的 被 试 的 
co 百分比 ; 2) 赞成 将 0. 1. 2...10 代 币 分 配给 接受 者 的 被 试 的 百分比 ; 3) 假设 自己 为 分 配 者 ， 
= 从 0~10 中 选择 一 个 整数 代表 自己 愿意 分 配给 接受 者 的 金额 ， 并 且 被 试 被 明确 告知 无 论 其 选 
= 择 如 何 都 不 会 受到 惩罚 。 被 试 完成 上 述 估计 后 ， 各 自从 计算 机 屏幕 上 观看 1 轮 独裁 者 博弈 : 
> 违规 组 被 试看 到 分 配 者 将 20% 的 初始 金额 分 给 了 接受 者 , 并 且 受 到 了 第 三 方 的 惩罚 ; 规范 组 


被 试看 到 的 分 配方 案 为 5: 5， 并 且 分 配 者 没有 受到 惩罚 。 接 着 ， 被 试 计算 参与 博弈 成 员 的 收 
c 益 ， 并 再 一 次 被 要 求 对 在 刚 完 成 的 博弈 中 1)、2) 4030 项 数字 进行 估计 。 
vr 和 实验 2 一 样 ， 我 们 用 两 种 方式 计算 被 试 的 规范 激活 水 平 : 第 一 种 方式 用 1) 和 2) 数 
字 各 自 的 加 权 平 均值 分 别 代表 描述 性 规范 和 命令 性 规范 的 激活 水 平 ; 第 二 种 方式 用 被 试 估计 

有 多 少 比例 的 分 配 者 将 《赞成 将 ) 20 代 币 中 的 7、8、9 和 10 代 币 分 配给 接受 者 来 代表 两 种 
规范 的 激活 水 平 , 我 们 主要 采用 第 一 种 操作 定义 来 检验 研究 问题 , 而 采用 第 二 种 操作 定义 作 
为 稳健 性 检验 。 此 外 ， 我 们 用 3) 项 数字 表示 被 试 的 合作 水 平 。 完 成 上 述 步骤 后 ， 实 验 者 宣 
布 实验 结束 ， 并 向 被 试 解 释 实验 设计 与 目的 并 支付 报酬 。 实 验 报酬 为 10 元 出 场 费 加 上 随机 
抽取 一 种 被 试 的 分 配方 案 所 产生 的 代 币 数 。 
4.3 结果 与 讨论 

我 们 首先 使 用 规范 激活 水 平 的 第 一 种 操作 定义 进行 了 统计 分 析 , 结果 发 现 , 不 同性 别 Ct 
= 0.45~1.51, p =0.133~0.652) 和 专业 CF =0.08~1.04, p = 0.374~0.972) 下 描述 性 规范 、 命 令 


性 规范 和 合作 水 平 的 差异 均 不 显著 ,年 龄 与 描述 性 规范 、 命 令 性 规范 、 合 作 水 平 Cr= -0.05~- 
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0.03, p= 0.420~0.602) 的 相关 系数 不 显著 。 以 分 组 (违规 组 、 规 范 组 ) 和 轮 次 (旁观 前 、 旁 
Wa) 做 二 因素 混合 设计 的 方差 分 析 ， 结 果 如 表 3 所 示 : 分 组 和 轮 次 的 主 效应 都 显著 ， 两 者 
的 交互 作用 也 显著 。 多 重 比较 结果 如 图 4 所 示 ， 违 规 组 被 试 在 旁观 惩罚 行为 后 的 合作 水 平 


(M=4.54, SD=2.59, n=80) 显著 高 于 旁观 前 水 平 (M=2.30, SD=2.37, n=80) (SE= 


S 


0.42, p < 0.001, 9594C.I. = [1.42，3.06])， 也 显著 高 于 规范 组 旁观 后 水 平 (M= 2.87, SD= 


2.73, n=80) (SE=0.42, p<0.001, 95%C.I. =[0.85, 2.49]); 规范 组 旁观 前 CM = 2.80, 


SD =2.82, n=80) 和 旁观 后 无 显著 差异 (SE=0.42, p=0.855, 95%C.1. = [-0.90，0.74]); 


旁观 前 两 组 也 无 显著 差异 (SE=0.42, p=0.235，95%C.I.=[-0.32，1.31])。 上 述 结果 表明 旁 
观 惩罚 行为 显著 提升 了 旁观 者 的 合作 水 平 ， 也 就 是 说 , 惩罚 提升 合作 的 效应 的 确 能 溢出 到 旁 
观 者 身上 , 并 且 这 种 溢出 效应 并 非 是 重复 测量 引起 , 因为 规范 组 旁观 前 后 合作 水 平 并 无 显著 
变化 。 这 为 研究 问题 3 提供 了 肯定 的 回答 。 

值得 一 提 的 是 , 两 组 被 试 所 观察 的 内 容 本 质 上 是 同一 规范 的 两 个 面向 : 遵守 规范 所 以 没 
AM SIRE T COU ZA) 或 违反 规范 所 以 遭受 惩罚 (违规 组 )， 然 而 这 两 种 不 同 的 呈现 方式 却 
产生 了 截然 不 同 的 效果 ， 这 在 一 定 程度 上 暗示 ， 比 起 展示 人 们 的 规范 行为 来 ， 展 示 遭 受 惩罚 
的 违规 行为 似乎 更 能 让 人 们 意识 到 社会 规范 的 存在 , 进而 更 有 效 地 改变 人 们 的 行为 模式 。 这 
个 结果 从 侧面 呼应 了 Cialdini 等 (1990) 的 发 现 ， 比 起 完全 没有 垃圾 的 场景 来 ， 地 面 有 少量 
垃圾 反而 更 能 激活 人 们 的 规范 意识 并 提升 其 环保 行为 。 这 可 能 是 因为 违规 行为 一 方面 从 侧面 
提醒 了 人 们 菜 种 规范 的 存在 ， 另 一 方面 只 有 极 少量 违规 行为 《Cialdini etal., 1990) 或 违规 行 
为 受罚 (本 研究 ) 则 意味 着 人 们 对 此 普遍 持 不 赞许 的 态度 ， 因 此 更 能 促进 人们 的 合作 行为 。 
这 一 发 现 对 制定 由 在 加 强人 们 合作 行为 的 政策 实践 具有 一 定 的 启发 意义 。 

表 3 二 因素 方差 分 析 结 果 


he 


来 源 均 方 F 显著 性 fii n? 
修正 模型 75.98 10.95 0.000 0.09 
截 距 3129.38 451.16 0.000 0.59 
轮 次 107.07 15.44 0.000 0.05 
分 组 27.44 3.96 0.048 0.01 
轮 次 x 分 组 93.42 13.47 0.000 0.04 


R?=0.094 GHZ R? = 0.086 ) 
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图 4 对 合作 行为 的 多 重 比较 
旁观 后 违规 组 被 试 的 描述 性 规范 COM = 3.37，SD = 2.20) 显著 高 于 规范 组 (M= 2.98, 


SD=1.89) (172.30, p—0.023, d—0.36, 95%C.I. = [0.06，0.73])， 违 规 组 被 试 的 命令 性 规 


ği (M=4.97, SD=2.77) 也 显著 高 于 规范 组 (M=4.18, SD=2.51) (t=3.32, p=0.001, 


d—0.52, 9594C.I. — [0.32，0.1.27])， 这 说 明 被 试 合作 行为 的 提高 可 能 是 由 于 劳 观 惩罚 而 激活 
了 两 种 社会 规范 。 进 一 步 以 分 组 〈 是 否 看 到 惩罚 ) 为 自 变量 、 描 述 性 规范 和 命令 性 规范 为 中 

介 变 量 、 合 作 水 平 为 因 变 量 检验 社会 规范 激活 是 否 中 介 了 惩罚 与 合作 行为 。bootstrap 检验 结 
果 显 示 规 范 激活 在 惩罚 与 合作 行为 之 间 起 到 部 分 中 介 的 作用 (图 5)， 其 中 是 否 看 到 惩罚 对 


合作 行为 的 直接 作用 显著 (Effect=1.23, SE=0.43, t=2.89, p=0.004, LLCI=0.39, ULCI 


= 2.08); 描述 性 规范 (Effect = 0.30, BootSE = 0.16, BootLLCI = 0.04, BootULCI = 0.85) 


对 合作 行为 的 间接 作用 显著 ; 但 命令 性 规范 (Effect= 0.13, BootSE=0.14, BootLLCI=-0.16, 
BootULCI= 0.40) 对 合作 的 间接 作用 不 显著 ,并 且 这 种 不 显著 主要 体现 在 “命令 性 规范 一 合 

作 ” 这 一 路 径 ， 也 就 是 说 惩罚 显著 地 影响 了 命令 性 规范 的 激活 水 平 ， 但 命令 性 规范 的 激活 却 
无 法 显著 改变 被 试 的 合作 行为 。 


0.85 一 
P di 


YE: “p<0.001, “p<0.01, "p «0.05. 
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图 5 描述 性 规范 的 中 介 作用 
采用 规范 激活 水 平 的 第 二 种 操作 定义 进行 的 稳健 性 检验 同样 得 到 了 类 似 的 结果 : 劳 观 后 


违规 者 的 描述 性 规范 (1=3.96，p < 0.001) 和 命令 性 规范 (t=4.89，p < 0.001) 的 激活 水 平 


均 显 著 高 于 规范 组 , 并 且 描 述 性 规范 的 间接 作用 显著 (Effect= 0.41, BootSE =0.19, BootLLCI 


=0.10, BootULCI = 0.83); 命令 性 规范 的 间接 作用 不 显著 (Effect = 0.30, BootSE = 0.20, 


BootLLCI= -0.06，BootULCI= 0.72)， 直 接 作用 显著 (Effect= 1.43, SE=0.49, t=2.90, p 
= 0.004)。 从 实验 3 的 结果 来 看 ， 无 论 采 用 哪 种 操作 定义 ， 两 种 规范 在 中 介 惩罚 与 合作 中 的 
作用 机 制 似乎 存在 显著 差异 ， 这 与 实验 2 形成 了 鲜明 对 比 。 

比较 描述 性 规范 和 命令 性 规范 这 两 条 路 径 , 我 们 看 到 实验 操作 确实 同时 激活 了 这 两 种 规 
范 , 对 两 种 规范 在 实验 操作 前 后 的 平均 数 差异 检验 也 验证 了 这 一 点 , 两 者 间 的 差别 主要 体现 
在 激活 后 的 描述 性 规范 提升 了 被 试 的 合作 水 平 , 但 命令 性 规范 却 未 能 起 到 类 似 作 用 。 对 上 述 
结果 的 一 种 解释 是 在 大 部 分 情况 下 人 们 更 容易 受到 描述 性 规范 的 影响 〈 陈 思 静 等 , 2015; 
Cialdini et al., 1991)， 因 为 描述 性 规范 涉及 的 是 事实 判断 《人们 是 怎么 做 的 ? )， 而 命令 性 规 
范 涉 及 价值 判断 《人 们 认为 应 该 怎么 做 ?” )， 个 体 对 事实 判断 的 信息 处 理 速 度 要 高 于 对 价值 
判断 的 处 理 (Deutsch & Gerard, 1955)。 进 一 步 比 较 实 验 2 和 3 的 结果 ， 可 以 看 到 一 个 明显 
的 差异 是 在 实验 2 中 描述 性 规范 和 命令 性 规范 的 中 介 效 应 均 显 著 , 且 无 显著 差异 , 尽管 单纯 
从 数字 上 来 看 ， 前 者 的 效应 略 高 于 后 者 ， 而 在 实验 3 中 描述 性 规范 的 中 介 作 用 显著 ,而 命令 
性 规范 不 显著 ,我 们 推测 这 可 能 是 因为 两 个 实验 中 被 试 的 个 人 卷 入 度 有 所 不 同 : 在 实验 2 中 ， 
被 试 在 第 一 阶段 杀身 经 历 了 惩罚 ， 而 在 实验 3 中 被 试 仅仅 旁观 了 他 人 受罚 , 因此 可 以 合理 地 
推测 被 试 在 实验 2 中 的 个 人 卷 入 度 更 高 。Petty 和 Cacioppo (1986) 指出， 当 个 人 卷 入 度 较 
高 时 ， 命 令 性 规范 对 行为 的 作用 更 为 明显 ， 这 一 观点 可 以 解释 实验 2 和 3 的 差异 : 由 于 实验 
2 中 被 试 的 卷 入 度 更 高 ， 因 此 命令 性 规范 对 合作 行为 的 作用 也 就 更 为 明显 ， 而 在 实验 3 中 低 
个 人 卷 入 度 导 致命 令 性 规范 的 影响 不 显著 。 


= 


5 总 讨论 
5.1 研究 意义 
大 量 文 献 探 讨 了 第 三 方 惩 避 抑制 违规 、 促 进 合作 的 作用 〈e.g., Fehr & Gáchter, 2002; 


Grimalda et al., 2016; Halevy & Halali, 2015)， 然 而 ， 这 种 作用 是 如 何 产生 的 这 一 问题 受到 的 
关注 相对 较 少 , 旦 现 有 文献 多 立足 于 经 济 学 视角 , 认为 惩罚 对 违规 收益 结构 的 改变 是 上 述 作 
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的 核心 机 制 〈 韦 倩 ， 姜 树 广 , 2013; Carpenter & Matthews, 2004; Nelissen & Mulder, 2013; 
Rand et al., 2010)。 这 一 解释 恰恰 有 悖 于 近年 来 行为 经 济 学 的 重要 发 现 ， 经 济 人 原则 在 决策 
过 程 中 并 不 总 是 发 挥 作用 (Kahneman, 2011; Thaler, 2016)， 除 非 我 们 先入 为 主 地 假定 违规 者 
恰好 总 是 理性 的 经 济 人 。 有 别 于 经 济 学 视角 ， 陈 思 静 等 〈2015) 以 及 Chen 5$ (20200 将 第 
三 方 惩罚 视 为 一 种 规范 提示 的 手段 , 换言之 , 第 三 方 惩罚 通过 激活 了 个 体内 化 于 心中 的 合作 
规范 (Rand etal.,2014) 来 提升 其 合作 水 平 ， 而 无 需 涉及 个 体 的 经 济 利 益 。 然 而 ， 要 在 严格 
意义 上 得 出 上 述 结 论 , 我 们 就 必须 排除 惩罚 对 收益 的 影响 ,因为 在 有 关 第 三 方 惩罚 的 主流 研 
究 中 ,惩罚 总 是 会 降低 被 试 的 收益 。 从 上 述 逻 辑 出 发 ,实验 1 首次 在 控制 惩罚 的 经 济 效应 后 
检验 了 惩罚 的 规范 提示 功能 ， 结 果 发 现 ， 即 使 惩罚 造成 的 损失 小 于 违规 行为 带 来 的 收益 

三 方 惩罚 依然 能 显著 抑制 违规 行为 并 提升 合作 水 平 , 换 名 话说 , 即便 是 违规 者 其 行为 也 未 必 
是 遵循 经 济 人 假设 。 古 希腊 哲学 家 苏 格 拉 底 的 一 个 著名 观点 是 ， 人 们 因为 无 知 而 作恶 〈 汪 


o 党 等 ,2004)。 本 文部 分 地 证 实 了 苏 格 拉 底 的 智慧 : 很 多 时 候 人 们 违规 只 是 因为 没有 意识 到 
S 某 种 规范 的 存在 , 激活 人 们 的 规范 意识 就 能 显著 降低 其 自私 行为 ， 而 第 三 方 惩罚 是 激活 人 们 
co 规范 的 重要 手段 之 一 。 上 述 发 现 的 一 个 实践 意义 是 ， 相 比 于 其 他 规范 激活 手段 ， 表 现 为 扣 减 
= 违规 者 报酬 的 经 济 惩罚 可 能 是 低 效 的 , 因为 经 济 惩罚 需 付出 成 本 , 而 扣除 惩罚 成 本 后 集体 的 
= 净 收 益 有 可 能 反而 更 低 了 (Dreber etal., 2008)。 因 此 ， 在 政策 实践 中 ， 我 们 需 识别 哪些 情境 


raf 
"T 


下 违规 是 因为 缺少 规范 意识 而 哪些 是 纯粹 为 了 获取 个 人 利益 , 不 区 分 违规 动机 而 一 刀 切 地 实 
施 惩罚 可 能 反而 降低 了 社会 的 运行 效率 。 
其 次 ， 实 验 1 的 结果 还 可 以 解释 以 往 文献 的 若干 发 现 。Rand 等 〈2009) 以 及 Fehr 和 
PT Rockenbach (2003) RI, EDDA A EER RAK S 3: AETA. ARRAY 
经 济 视 角 并 不 能 完全 解释 上 述 现象 , 但 如 果 我 们 将 第 三 方 惩罚 视 为 规范 提示 的 手段 ， 上 述 问 
题 便 迎刃而解 : 作为 规范 提示 的 惩 避 自身 必须 符合 某 种 规范 ， 也 就 是 说 ， 必 须 具备 某 种 道德 
合法 性 , 违反 规范 的 惩罚 显然 不 可 能 具有 规范 提示 的 作用 , 因而 也 就 失去 了 促进 合作 的 积极 
作用 。 上 述 观 点 的 一 个 推论 是 如 果 和 无 罚 完全 不 具备 经 济 功能 , 那么 我 们 可 以 在 很 大 程度 上 排 
除 惩罚 的 不 合理 动机 (如 惩罚 是 为 了 提高 自身 的 相对 优势 )， 在 这 种 情况 下 ， 按 照 实 验 1 的 
结果 ,我 们 应 该 能 观察 到 这 类 惩罚 对 合作 同样 具有 促进 作用 .事实 上 ,确实 有 研究 者 注意 到 ， 
面 对 违 规 行为 ， 他 人 的 言语 责备 〈《 也 有 学 者 将 言语 责备 称 为 社会 惩罚 或 道德 惩罚 ) 就 能 起 到 
类 似 的 作用 CNoussair & Tucker, 2005)， 而 无 需 对 违规 者 造成 具体 的 金钱 或 物质 损失 ， 甚 至 
比 以 降低 经 济 收益 为 目标 的 惩罚 效果 更 好 (Wu et al., 2016)。 实 验 1 的 结果 可 以 解释 上 述 现 


象 : 尽管 言语 责备 并 未 改变 惩罚 的 收益 ,但 和 第 三 方 惩罚 类 似 ， 言 语 责备 起 到 了 提示 违规 者 
18 
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存在 某 种 规范 的 作用 , 同时 言语 责备 在 很 大 程度 上 排除 了 为 自身 牟利 的 非法 动机 ,从 而 有 效 
地 降低 了 违规 者 的 自私 行为 。 当然 , 也 有 研究 者 认为 言语 责备 的 作用 同样 可 以 从 经 济 角 度 来 
解释 ， 比 如 van den Berg 5$ (20120 认为 成 本 表现 为 多 种 形式 ， 言 语 责备 尽管 未 必 会 提高 违 
规 行 为 的 金钱 成 本 , 但 可 能 提高 了 违规 者 在 人 际 关 系 方面 的 成 本 , 因此 实际 上 依然 减少 了 违 
规 者 的 收益 。 然 而 ， 实 验 室 环境 中 的 言语 责备 往往 程度 较 轻 ， 如 “我 认为 你 的 分 配方 案 不 公 
平 ”(Nelissen & Mulder, 2013) BK “FARRAR ROA” SE MES, 2017)， 且 经 常 发生 
FEE AEE CUE, RISE, 2020), KA FIRE DEZIRA TER BB BEN XBXUS 
的 人 际 利益 造成 实质 性 损害 。 综 上 所 述 , 我 们 认为 实验 1 的 结果 可 以 更 好 地 解释 言语 责备 对 
合作 的 提升 作用 。 

第 三 , 更 为 重要 的 是 , 本 文 基于 社会 规范 视角 提出 了 第 三 方 惩罚 是 如 何 维持 人 类 社会 长 


时 间 、 大 规模 的 合作 。 惩罚 降低 收益 的 经 济 学 观点 无 法 解释 上 述 现象 ， 因 为 完全 理性 的 个 体 
> 首 经 受罚 的 经 历 不 足以 使 其 在 新 情境 下 表现 更 好 ,除非 在 新 情境 下 依然 存在 惩罚 机 制 ,然而 
S 正如 Shreedhar $ (2019) 指出 ， 无 处 不 在 的 徒 罚 会 极 大 提高 社会 运行 成 本 。 而 我 们 在 实验 
c 2 和 3 中 所 发 现 的 第 三 方 惩罚 的 两 种 溢出 效应 可 以 很 好 地 解释 为 什么 第 三 方 惩罚 可 以 维持 广 
= 泛 的 合作 行为 :实验 2 表明 第 三 方 惩罚 的 规范 激活 作用 不 仅 抑制 了 被 试 在 当前 博 讲 情境 中 
= 的 违规 行为 ， We IPRS T BERR MIT PEO AR, 我 们 把 上 述 作用 称 2 


> 为 “纵向 溢出 效应 ” 而 实验 3 BUZ Au $5 10 BU Ya 8M AS A AE 4E A n] Té. BD] — 
体 身 上 , 也 同样 发 生 在 了 旁观 而 非 参与 博弈 的 个 体 身 上 , 即 人 们 只 要 作为 旁观 者 观察 到 了 违 
c 规 者 受到 惩罚 ， 那 么 惩罚 的 规范 激活 作用 就 能 发 挥 作用 ， 相 应 的 ， 上 述 效应 或 可 称 为 “横向 
FI AUC. ETRE, HER UR ESE S EAEE, KAREAR E 
加 的 效果 并 不 仅仅 体现 在 当下 , 还 可 以 在 时 间 和 空间 维度 持续 发 挥 作用 : 惩罚 在 很 大 程度 上 
一 种 规范 提示 , 因而 受罚 者 或 目睹 受罚 的 劳 观 者 通过 激活 自身 内 在 的 规范 而 抑制 了 潜在 的 
违规 冲动 ,并 使 合作 水 平 在 一 定 范围 内 保持 在 较 高 水 平 , 而 无 需 外 在 的 您 罚 者 时 时 监督 违规 
行为 并 处 以 惩罚 。 综 上 所 述 , 本 研究 的 男 一 意义 在 于 本 文 所 发 现 的 第 三 方 人 惩罚 的 两 种 洲 出 痪 
应 为 理解 惩罚 如 何 维持 人 类 社会 的 广泛 合作 提供 了 新 的 理论 思路 。 需要 指出 的 是 , 我 们 对 上 
述 实验 结果 的 解释 并 不 是 唯一 的 ，Gintis 和 Fehr (2012) 提出 了 另 一 种 解释 : 惩罚 对 合作 的 
提升 仍然 依赖 于 惩罚 对 违规 收益 的 降低 作用 ， 只 不 过 惩 习 无 需 对 违规 者 造成 实际 的 损失 ,只 
要 违规 者 担心 惩罚 有 可 能 给 他 们 造成 损失 , 惩罚 就 能 发 挥 积极 作 用 。 上 述 观 点 的 确 可 以 从 成 
本 -收益 的 经 济 学 角度 来 解释 为 什么 少数 几 次 惩罚 就 可 以 维持 大 规模 的 合作 ， 然 而 ， 为 了 排 


除 这 一 竞争 性 假设 ， 我 们 在 实验 2 和 3 中 均 明 确 地 告知 被 试 无 论 他 /她 是 否 违规 ， 都 不 会 受 
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BEAT AE TI. KS BCE TEA SEE EHER T Xe BCT TE $5 TH SEL T ee SPE ZK 
Yo RAZ, Ke 2 和 3 的 结果 更 加 支持 惩罚 的 规范 提示 解释 ， 而 非 惩罚 的 威慑 解释 。 当 
然 , 合作 作为 社会 科学 中 最 大 的 谈 题 之 一 (Bear & Rand, 2016), 可 能 并 不 存在 单一 的 解释 ， 


也 就 是 说 ,我 们 基于 社会 规范 的 解释 与 Gintis 和 Fehr (2012) 的 理论 可 能 并 非 相 互 排斥 ， 而 
是 相互 补充 ， 从 而 为 合作 的 演化 这 一 难题 提供 更 完整 的 答案 。 
52 研究 不 足 

尽管 取得 了 若干 有 意义 的 结果 , 但 本 研究 尚 存在 一 定 的 不 足 之 处 。 首 先 ， 本 研究 采用 了 
御 为 主流 研究 范式 的 经 济 惩罚 , 即 惩罚 成 本 和 违规 成 本 均 表 现 为 金钱 成 本 , 这 种 设 定 有 利于 
究 者 得 出 相对 清晰 的 结论 ， 但 现实 生活 中 的 成 本 往往 表现 为 多 种 形式 (Guala, 2012), H. 
不 同形 式 的 成 本 会 对 结果 产生 不 同 影响 〈 陈 思 静 等 ,2020)。 当 成 本 表现 为 非 金钱 形式 时 《如 
个 体 的 时 间 、 精 力 或 人 际 资源 等 ), 本 文 的 结论 是 否 依然 成 立 是 一 个 值得 进一步 探索 的 问题 。 


zn 


> 其 次 , 虽然 本 研究 明确 地 发 现 了 第 三 方 惩罚 的 两 种 溢出 效应 , 但 由 于 前 后 相隔 时 间 较 短 ( 不 
S 超过 1 个 小 时 ), 因此 , 我 们 很 难 确定 当 受 罚 或 旁观 受罚 的 经 历 与 下 一 轮 博弈 间隔 较 久 时 (如 
co 一 周 或 一 个 月 ) 这 种 溢出 效应 是 否 依然 存在 , 在 较 长 的 时 间 跨 度 内 展开 上 述 实验 有 助 于 提高 
= 本 研究 结论 的 说 服 力 。 再 次 , 在 实验 3 中 我 们 比较 了 规范 的 两 种 呈现 方式 (遵守 规范 而 不 受 

T] vs. 违反 规范 而 受罚 ) 对 被 试 合作 水 平 的 影响 ， 从 更 为 广阔 的 理论 视角 来 看 ,更 有 意义 的 


比较 可 能 是 “遵守 规范 得 到 奖赏 ” 和 “违反 规范 受到 惩罚 ”这 两 种 展示 方式 对 合作 与 规范 激 
活 的 影响 , 但 由 于 本 文 的 研究 焦点 在 于 惩罚 对 抑制 违规 、 促 进 合 作 的 作用 ， 因 而 未 能 对 上 述 
比较 做 出 分 析 ， 未 来 研究 可 进一步 对 此 进行 探索 。 最 后 ,我 们 在 实验 中 注意 到 ， 惩 罚 的 溢出 
效应 在 迁移 过 程 中 发 生 了 损耗 , 这 在 一 定 程度 上 暗示 第 三 方 惩罚 对 维持 大 规模 的 合作 是 有 一 
定 界限 的 , 这 一 结果 符合 先前 研究 者 的 观察 , 即 第 三 方 惩罚 的 上 述 作用 随 着 社 群 规模 的 扩大 
而 逐渐 减弱 (Greif, 1993)， 同 时 也 表明 , 仅仅 依靠 自 下 而 上 的 第 三 方 惩 避 似乎 还 不 足以 彻底 
解释 人 类 个 体 间 的 广泛 合作 ， 而 引入 其 他 机 制 如 自 上 而 下 的 群集 惩罚 Cpool punishment) 


(Baldassarri & Grossman, 2011) HMAT] (coordinated punishment) 〈 韦 倩 等 ,2019) 或 许 


能 帮助 我 们 更 好 地 理解 人 类 社会 的 合作 现象 。 
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Abstract 
A large body of experimental evidence demonstrates that in presence of third-party punishers, 
cooperators can gain higher payoffs than defectors. As a result, third-party punishment (TPP) that 
changes the payoff structure of defectors is believed to be a key in promoting cooperation. However, 


this rationale is contrary to an important finding in behavioral economics: individuals are not 
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necessarily rational decision makers and do not have purely self-regarding preferences. This 
contradiction raises an interesting question: can this finding also be applied to defectors? We aim to 
explore this question through three experiments. 

In Experiment 1, 240 undergraduates participated in a Public Goods Game and were divided 
randomly into three conditions: control condition (CC), low defection cost condition (LC), and high 
defection cost condition (HC). In each round of the game, participants in CC decided whether to 
contribute 10 tokens from the initial endowment to the public account. All the tokens contributed to 
the public account were doubled and evenly allocated to all group members. Participants who 
retained 10 tokens needed to pay a tax of 1 token. The procedures in LC and HC were identical to 
that in CC. An exception is that in LC and HC, independent punishers could discipline defectors by 
paying 5 tokens to reduce the payoff of defectors by 1 token in LC and 10 tokens in HC. In 
Experiment 2, 179 participants who defected in Stage 1 were selected as sample in Stage 2 and were 
divided randomly into two conditions: CC (89 participants) and punishment condition (PC, 90 
participants). Participants in PC were told they had been punished in Stage 1, whereas those in CC 
received no feedback. All participants’ levels of norm activation and cooperation in different games 
were then measured. Experiment 2 was replicated in Experiment 3, where the participants were not 
game players but spectators, and their levels of norm activation and cooperation were measured 
before and after the game. The participants in defection condition observed a defection and the 
consequent punishment, whereas those in norm condition observed a fair offer and no punishment. 

In Experiment 1, the defection cost in LC was lower than that in CC, so participants in LC had 
a stronger incentive to defect. However, the results revealed a significantly higher cooperation level 
in LC. A plausible explanation is that the defection cost in form of punishment served as a norm 
reminder, but cost in form of tax lacked this function, implying that even defectors are not 
necessarily benefit maximizers. The results of Experiment 2 confirmed this explanation: compared 
with unpunished defectors, the punished ones manifested a higher level of norm activation. The 
bootstrap analysis showed that the norm activation completely mediated TPP and cooperation. 
Experiment 2 also found a spillover effect of TPP: the punished defectors still demonstrated a high 
cooperation in a new different game where the sanction was absent. Finally, Experiment 3 found 
another spillover effect of TPP: bystanders who did not experience the punishment in person but 
witnessed it showed a significantly higher cooperation in subsequent interactions. 

In conclusion, oftentimes, people defect simply because they are unaware of the existence of a 
certain norm, and activating people’s norms through TPP can significantly reduce their selfish 
behaviors. In addition to being an economic means to reduce defectors’ payoff, TPP serves as a 
norm reminder. The two spillover effects found in this study suggest that TPP as a means of norm 
activation may be more efficient than as an economic means because of its cost-effectiveness. These 
findings shed new light on the understanding of extensive cooperation among genetically unrelated 
individuals. 


Key words third-party punishment, social norm, cooperation, focus theory, spillover effect 
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